官群：具身语言的理论基础

官群语言科学 2021-09-20

导语

具身语言学打破传统的“用电脑结构来认知人脑”的离身认知观，从崭新的具身认知观视角出发，针对语言认知和学习的现象，揭示具身感知经验如何塑造并重塑语言认知的各元素或多元素的融合，聚焦语言认知机制对应的重要具身认知官能，如感知运觉通路、镜像神经元赫布学习、大脑的拓扑图型神经网络，利用行为和神经影像学的方法（包括fMRI, NIRs和ERPs），为语言的生成、发展与优化的感知觉印痕被激活提供心理模拟的实验证据。这一新兴的语言科学具有很强的综合性、交叉性、实证性，涉及大量的神经科学和生理认知关联信息网络的基础知识，针对语音、语法、词法和语篇多个语言元素层面的语言学现象，旨在破解这一“人脑如何成为电脑”，“ 如何模拟人类语言思维实现类脑思维”的终极人工智能时代的科学命题。

20世纪80年代后期起，对比之下，具身认知研究在国外比国内热，在其他领域比在语言学领域热；在语言学领域，国内正呈现方兴未艾之势，国外多以主题聚焦的精细深入研究为主，其议题主要聚焦在 “行动为基础的语言观”的理论探讨、“感知和动觉机制融合与抑制”的机制探究、“做中学”与“经验痕迹塑造与重塑”的语言教与学的实践应用等议题上。鉴于长期在语言学中存在的“对比”思维，而具身语言学力争“求同存异、协同共赢”的方式，力图解决具身认知理论与中国本土语言认知相融合的语言学习科学研究变革问题，亟待进行理论化、系统化、本土化、科学化的整合交叉研究。本着系统化、科学化、交叉性、协同性原则，接下来将从以下几方面对具身语言研究进行简要梳理。

栏目一：具身语言的理论基础

一、概述

自20世纪50年代起，传统认知科学中的非模态系统理论就一直在语言理解领域占主导。认为语言的处理是基于抽象的非模态符号系统，语言与指代物之间的关系是任意的，感官-运动系统与理解高级认知过程无关 (Fodor，1975)。

新的具身认知观（Embodied Cognition）的出现挑战了非模态理论的主导地位。主张认知是一种高度具身的、情景化的活动，甚至思维的存在应当首先被看作是行动的存在” (Anderson，2004)；认知依赖于某种类型的经验，这些经验来自具有特殊感觉运动能力的身体，而感觉运动能力又与形成记忆、情感、语言和生命的其他方面的基质不可分割地联系在一起。得到了神经科学（如，Eskenazi et al., 2009）、认知心理学以及认知语言学（Borghi et al., 2011）研究的支持。具身认知观为语言理解的研究视角以及理论诠释提供了新方法。

二、主要理论

早期语义表征理论主要关注词汇的关联方式，即语义体构成的方式（Quillian, 1968; Collins & Loftus, 1975）。其他理论从语言共享数据的角度解释了相似性，这种信息连接了相同语境中的词汇（Landauer & Dumais，1997）。

（一）离身理论

离身理论认为语义信息是完全独立于感知运动系统的，如果感知运动系统遭到破坏，在语义过程中，语义信息不能预测语义障碍。Levelt认为语言必须有命题性，即符号和语言信息激发了一些特殊词汇。在潜在语义分析中（LSA, Landauer & Dumais, 1997）词汇意思由和其相关词汇来决定，而不是由它所指的事物决定。所以，词汇意义是由一系列抽象符号来定义的。

（二）二次具身理论

语义表征和感知运动内容之间的关系是非任意的。Mahon和Carmazza (2008) 认为这是由于非模态概念表征是通过检索感知运动信息来具身化的。Quillian认为语义系统是独立的，但又直接与感知运动信息相关；当感知运动信息受到破坏时，会出现一些轻度的语义障碍。Mahon 和 Caramazza认为语义内容和做事动机信息一样，是互动形成的。这里，所有的概念都是抽象的、非模态的，由感知运动信息进行表达，但是，当一个确定的概念表达出来时，接着就会形成特定的感知运动信息的主动激励。因此，感知运动信息的破坏会导致“低级的或孤立的概念”。

(三) 弱具身理论

研究者们提出语言处理来自感官-运动模拟和词语之间的相互依赖。主要有Barsalou等(2008) 的语言情景仿真理论 (Language and Situated Simulation Theory，LASS) 和Louwerse (2007) 的符号交互系统 (Symbols Interdependency System)。这些弱具身理论很相似，认为语言理解既是符号的又是具身的。语言系统在不需要深度信息处理的任务中占主导地位，而模拟系统在语言系统无法处理的任务中占主导地位。

（四）强具身理论

支持强具身观点的理论认为，人类认知完全基于感官-运动系统。目前有四种强具身理论推动了该领域的研究：Barsalou (1999) 的感知符号系统 (Perceptual Symbol System, PSS)；Glenberg和Robertson 的索引假说 (Indexical Hypothesis) (1999, 2000)；Zwaan (2004) 的浸入式体验者框架 (Immersed Experiencer Framework)，Glenberg和Gallese (2012) 的行动基础理论 (Action-based language theory, ABL)。

感知符号系统指出负责语言理解的认知过程部分地重新激活感官，运动和感情系统形成有意义的心理表征。索引假说认为索引句子中的第一个单词和短语模拟物理世界中的对象、图片或知觉符号来建立与对象之间可能的互动组合，且语言的理解是通过句法来协调的。浸入式体验者框架认为语言是人们用于构建感官-运动模拟情境的线索。语言理解的过程就是理解者激活语言符号的经验表征 (词汇、语法等) 和相关的经验表征，这些符号涉及知觉、运动和情绪化符号动态浸入所描述的情景。行动基础理论是一种基于行动解释语言处理的模型，根据这一理论，语言理解等同于预测行动的感官运动和情感效应。

作为这些理论的核心观点是，语言理解不是非模态系统复述或翻译的产物。显然，这些强具身理论之间相互支持。

三、哲学理论基础

（一）心灵哲学的思辨

语言的具身，是通过具身代理，进行身体行为和环境的交互作用，让世界变得更容易被理解和记忆。独立主义认为，世界是输入的来源和输出的环境。这引发较多争议。反表征主义的论断认为，一个正常的代理环境的交互应该表现出一个复杂和循环的因果状态。最小笛卡尔主义试图通过，如本体回馈机制，解释具身认知的互动环境现象。该机制发射信号告诉大脑如何支配上肢。为了有效作用于具身代理器，必须跟人的经验密切结合，整合外显和内部表征的共享符号系统，建立一个包容的视野，寻求交互策略。

（二）身体、心灵与文化的统一

根据中国古典传统形而上学，“人”被看作是一个整体的身心过程。日本（Kasulis, 2004）和印度哲学的传统认为人体实际上是心灵的身体，不是一个单纯的身体或者在某种程度上附着了心灵的身体” (Koller, 2004)。亚洲三大哲学传统都认同身心统一的整体观。但西方哲学认为大脑和身体是分离的，身体并不总是能得到其应有的地位。后来，笛卡尔主义倾向于贬低身体的地位，支持心灵的地位，甚至把身体形容为心灵的敌人。随着具身的概念向不同方向延伸，产生了彼此高度分歧的不同具身理论，但有时也存在一点共性。Gibbs（2006) 概述了“具身前提”，即人类身体参与到物质文化世界时产生认知。身体被视为文化中更广泛的一部分。为此，一些认知语言学家和认知科学家称之为基于社会文化的具身。

（三）语言具身的进化哲学

目前有三个计算或动态的链接框架，能够实现语言学活动促进认知的自我刺激模式。一是语言理解的纯粹翻译模型，语言通过翻译过程将句子转化为获得实际内容的内部代码来影响思想 (Fodor, 1994)。这可能是被称为“纯翻译”语言观点的一个最好例子。二是词作为物质世界的新目标模型，语言作为互补资源的核心是对增加对世俗语言结构的欣赏。语言的可见、可听或可触的物质性是其独特的关键特征，也是其许多认知潜力的来源。三是词作为混合思想的组成模型，当把数词的使用归因于更基本的生物能力时，我们具备了不断增强的表达无限数词的能力。接触具体的、可感知的数词使得具身代理能够进行推理。具身代理视语言为复杂世界中新物质结构层次，发挥各种促进认知能力的作用。具身可以充当营造学习环境的新的、可感知的简单目标；提取记忆并帮助分散注意力，为解读复杂的想法提供了关键资源。

四、神经生理理论基础

（一）感觉动作模拟的神经生理基础——神经元理论

Rizzolatti 等 (1996) 在猴腹侧前运动皮层 (F5区) 首次发现了镜像神经元。不论是自己做出动作还是看到别人做出同样的动作，这些特殊的视觉运动神经元都会激活。镜像神经元的一个基本功能是行为理解。在灵长类的社会认知中，理解社交事件的问题至关重要，因为它代表了社会信息的第一个基本步骤，且这些社会信息来源于视觉和听觉刺激。此后，众多脑电数据（如Hari，2006）以及经颅磁刺激 (Fadiga et al., 1995) 数据都间接证明，人类也有镜像神经元系统，涉及顶下小叶或者布罗德曼7b区等区域。

镜像神经元可能参与模仿，该假设是基于在行动观察期间特定的运动皮层表征会被激活，激活的运动信息可暂时存储并用于重复相同的操作。对人类的研究表明，模仿能力不一定与复杂的认知技能相关联。模仿是学习的基础，更复杂的模仿形式将涉及更多的认知和神经资源。人类镜像神经系统是模仿学习的认知神经基础。

（二）具身语言活动的神经生理指标——μ波抑制理论

镜像神经元系统活动的一个重要指标是μ波 (8-13Hz) 抑制，探究μ节律与镜像神经元系统活动功能的关联是具身认知领域中的最新研究趋势。在理解语言时会产生μ波抑制。μ波抑制是感知与行为相匹配的神经机制，使行为的识别与理解成为可能。μ节律是一种将感知转化为行动的关键信息处理功能。μ节律中与任务相关的变化更精确地反映了皮层的激活或失活。

此外，μ波抑制是镜像神经元的活动指标，主要包括：1. 直接和间接动作时的μ波抑制，随意运动、观察、执行或者想象运动，进行目标导向行为时的μ波衰减反映了运动皮层中的镜像神经元活动。2. μ波去同步话可测量运动激活功能，但在语言研究领域几乎无人关注 (van Elk et al., 2010)。语言和行动系统在人脑中的功能连接也是通过μ波抑制体现的。3.高级社会功能认知也伴随着μ波抑制的出现。心理理论试图表明动觉和意识机制是通过社会交往建立的。理解他人的意图也可能会包括对人类镜像神经元系统的模拟。

（三）神经回路映射和裂解感觉运动回路理论

理解神经回路如何实现将感官输入与行为联系起来的计算，是系统神经科学的一个中心目标。具身语言学思想为这一回路闭环做出了一定尝试。

根据具身语言学定义，神经约束回路有三个组成部分：识别回路内的相关神经元群体；根据被检查的行为表现出量的增加或减少，确定神经元是否促进或抑制行为；将不同的神经元类型排列成网络内的分层途径。这种对回路约束方法的核心弱点是感官输入和行为输出都是多维的。感觉运动回路包括以感觉开始并以运动输出结束连接的一组神经元。这些回路往往受其他感觉模态和输入的影响。所以人们可以只考虑其活动在时间尺度上与所研究的刺激和行为相当的神经元。

感官输入通常是高维的，而自然刺激则是高度结构化的，刺激特征的许多特定组合被过度表征。任何感官系统似乎都不可能实现真正的无损编码。神经科学研究一般选择相对简单的刺激，这些刺激代表某些线索的基本功能。在线性系统中，使用特定类型的输入将任意数量动态变化的刺激特征与行为或神经反应联结。

行为是回路的最终输出。回路实现的完整感觉运动变化只能通过测量每个运动神经元的输出来获得。感官输入影响高水平的行为命令或低水平的、精细的运动行为模式。感知运动转换中涉及的回路通过提供刺激，引发行为输出。随着时间的推移，大脑可以在统计学中以及试验的基础上，获取这些运动模式的信息，通过本体感受传感器和回路，将运动指令的不同拷贝返回给感觉系统。

神经元可通过基因操作激活或失活。在最简单的情况下，神经元是完全线性的，因此沉默或激活的影响很容易解释。常见的调控机制会对操纵实验造成严重破坏。尽管极端操作可能是有利的，但增加了补偿机制塑造最终产物的可能性。鉴于大脑的复杂性，回路功能模型十分重要且有两个重要的作用。一，该模型能够提供充分测试；二，该模型可以生成可测试的实验假设。

: ， . Video Mini Program Like ，轻点两下取消赞 Wow ，轻点两下取消在看

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

阿哲现身评论区，@一修！肉肉痛哭，无限期停播！回应舆论黑料，关闭私信评论区！

登热榜！某牙电母被S，榜一求爱遭拒！柚柚阿哲合体年度走红毯！

官群：具身语言的理论基础

您可能也对以下帖子感兴趣

李宜雪的良知卖了2万元，真正需要声援的是罗灿宏啊

故意按摩让女生“产生欲望”后发生关系，算性侵吗？

洗牌电商圈！阿哲放话全网：挑战抖音所有机制！爆全品类大牌！

阿哲现身评论区，@一修！肉肉痛哭，无限期停播！回应舆论黑料，关闭私信评论区！

登热榜！某牙电母被S，榜一求爱遭拒！柚柚阿哲合体年度走红毯！

生成图片，分享到微信朋友圈

官群：具身语言的理论基础

您可能也对以下帖子感兴趣